home *** CD-ROM | disk | FTP | other *** search
/ Internet Surfer 2.0 / Internet Surfer 2.0 (Wayzata Technology) (1996).iso / pc / text / mac / faqs.205 < prev    next >
Encoding:
Text File  |  1996-02-12  |  27.9 KB  |  647 lines

  1. Frequently Asked Questions (FAQS);faqs.205
  2.  
  3.  
  4.  
  5.           Critical Facts about the PKZIP Trojan
  6.  
  7. CIAC has learned that two bogus versions of the popular archiving
  8. utility PKZIP for PC-DOS and MS-DOS machines are being circulated on
  9. several BBSs around the country. The two bogus versions of PKZIP are,
  10. 2.01 (PKZ201.ZIP and PKZ201.EXE) and 2.2 (PKZIPV2.ZIP and PKZIPV2.EXE).
  11. If you have downloaded any of these files, do not attempt to use them.
  12. You risk the destruction of all the data on your hard disk if you do.
  13.  
  14. At the current time, the released version of PKZIP is version 1.10. A
  15. new version of PKZIP is expected to be released in the next few months.
  16. Its version number was planned to be 2.00, but may be increased to a
  17. number greater than 2.2 to prevent confusion with the bogus versions.
  18. PKWARE Inc. has indicated it will never issue a version 2.01 or 2.2 of
  19. PKZIP. A good copy of the latest version of PKZIP can always be gotten
  20. from the PKWARE BBS listed below.
  21.  
  22. According to PKWARE Inc. version 2.01 is a hacked version of PKZIP 1.93
  23. Alpha.  While this version does not intentionally do any damage, it is
  24. alpha level software, and may have serious bugs in it.
  25.  
  26. Version 2.2 is a simple batch file that attempts to erase your C:\ and
  27. C:\DOS directories. If your hard disk has been erased by this program,
  28. you may be able to recover it using hard disk undelete utilities such
  29. as those in Norton Utilities, or PCTools. Don't do anything that might
  30. create or expand a file on your hard disk until you have undeleted the
  31. files, as you may overwrite the deleted files which will destroy them.
  32. To examine a file to see if it is version 2.2, type it to the screen
  33. with the DOS TYPE command. If the file that prints on the screen is a
  34. short batch file with commands such as DEL C:\*.*, or DEL C:\DOS\*.*
  35. then you have the bogus file.
  36.  
  37. For additional information or assistance, please contact CIAC:
  38.  
  39.      CIAC at (510) 422-8193/(FTS)
  40.          FAX (510) 423-8002/(FTS)
  41.      send e-mail to ciac@llnl.gov.
  42.  
  43. ------------------------------------------------------------------------------
  44.  
  45. Subject: [4] What is an archiver?
  46.  
  47.  
  48. There is a distinction between archivers and other compression
  49. programs:
  50.  
  51. - an archiver takes several input files, compresses them and produces
  52.   a single archive file. Examples are arc, arj, lha, zip, zoo.
  53.  
  54. - other compression programs create one compressed file for each
  55.   input file. Examples are freeze, yabba, compress. Such programs
  56.   are often combined with tar to create compressed archives (see
  57.   question 50: "What is this tar compression program?").
  58.  
  59. ------------------------------------------------------------------------------
  60.  
  61. Subject: [5] What is the best general purpose compression program?
  62.  
  63.  
  64. The answer is: it depends. (You did not expect a definitive answer,
  65. did you?)
  66.  
  67. It depends whether you favor speed, compression ratio, a standard and
  68. widely used archive format, the number of features, etc...  Just as
  69. for text editors, personal taste plays an important role. compress has
  70. 4 options, arj 2.30 has about 130 options; different people like
  71. different programs. *Please* do not start or continue flame wars on
  72. such matters of taste.
  73.  
  74. The only objective comparisons are speed and compression ratio. Here
  75. is a short table comparing various programs on a 33Mhz Compaq 386.
  76. All programs have been run on Unix SVR4, except pkzip and arj which
  77. only run on MSDOS.  Detailed benchmarks have been posted in
  78. comp.compression by Peter Gutmann <pgut1@cs.aukuni.ac.nz>.
  79.  
  80. *Please* do not post your own benchmarks made on your own files that
  81. nobody else can access. If you think that you must absolutely post yet
  82. another benchmark, make sure that your test files are available by
  83. anonymous ftp.
  84.  
  85. The programs compared here were chosen because they are the most popular
  86. or because they run on Unix and source is available.  For ftp
  87. information, see above. Two programs (hpack and comp-2) have been added
  88. because they achieve better compression (at the expense of speed)
  89. and one program (lzrw3-a) has been added because it favors speed at
  90. the expense of compression:
  91. - comp-2 is in wuarchive.wustl.edu:/mirrors/msdos/ddjmag/ddj9102.zip
  92.   (inner zip file nelson.zip),
  93. - hpack is in wuarchive.wustl.edu:/mirrors/misc/unix/hpack75a.tar-z
  94.   and garbo.uwasa.fi:/unix/arcers/hpack75a.tar.Z
  95. - ftp.adelaide.edu.au:/pub/compression/lzrw3-a.c  [129.127.40.3]
  96.  
  97. The 14 files used in the comparison are from the standard Calgary
  98. Text Compression Corpus, available by ftp on fsa.cpsc.ucalgary.ca [136.159.2.1]
  99. in /pub/text.compression.corpus/text.compression.corpus.tar.Z.
  100.  
  101. The whole corpus includes 18 files, but the 4 files paper[3-6] are
  102. generally omitted in benchmarks. It contains several kinds of file
  103. (ascii, binary, image, etc...) but has a bias towards large files.
  104. You may well get different ratings on the typical mix of files that
  105. you use daily, so keep in mind that the comparisons given below are
  106. only indicative.
  107.  
  108. The programs are ordered by decreasing total compressed size. For a
  109. fair comparison between archivers and other programs, this size is
  110. only the size of the compressed data, not the archive size.
  111.  
  112. The programs were run on an idle machine, so the elapsed time
  113. is significant and can be used to compare Unix and MSDOS programs.
  114.  
  115. [Note: I still have to add all decompression times.]
  116.  
  117.        size     lzrw3a   compress    lharc    yabba     pkzip    freeze
  118. version:                   4.0       1.02      1.0       1.10     2.3.5
  119. options:                                    -m300000
  120.        ------    -----    ------    ------    ------    ------   ------
  121. bib    111261    49040     46528     46502     40456     41354    41515
  122. book1  768771   416131    332056    369479    306813    350560   344793
  123. book2  610856   274371    250759    252540    229851    232589   230861
  124. geo    102400    84214     77777     70955     76695     76172    68626
  125. news   377109   191291    182121    166048    168287    157326   155783
  126. obj1    21504    12647     14048     10748     13859     10546    10453
  127. obj2   246814   108040    128659     90848    114323     90130    85500
  128. paper1  53161    24522     25077     21748     22453     20041    20021
  129. paper2  82199    39479     36161     35275     32733     32867    32693
  130. pic    513216   111000     62215     61394     65377     63805    53291
  131. progc   39611    17919     19143     15399     17064     14164    14143
  132. progl   71646    24358     27148     18760     23512     17255    17064
  133. progp   49379    16801     19209     12792     16617     11877    11686
  134. trans   93695    30292     38240     28092     31300     23135    22861
  135.     3,141,622  1,400,105 1,259,141 1,200,580 1,159,340 1,141,821 1,109,290
  136. real             0m35s     0m59s     5m03s     2m40s              5m27s
  137. user             0m25s     0m29s     4m29s     1m46s              4m58s
  138. sys              0m05s     0m10s     0m07s     0m18s              0m08s
  139. MSDOS:                                                   1m39s
  140.  
  141.  
  142.          zoo       lha       arj      pkzip      zip      hpack   comp-2
  143.         2.10    1.0(Unix)   2.30      1.93a      1.9      0.75a
  144.          ah    2.13(MSDOS)   -jm       -ex        -6
  145.        ------    ------    ------    ------    -------   ------   ------
  146. bib     40742     40740     36090     35186      34950    35619    29840
  147. book1  339076    339074    318382    313566     312619   306876   237380
  148. book2  228444    228442    210521    207204     206306   208486   174085
  149. geo     68576     68574     69209     68698      68418    58976    64590
  150. news   155086    155084    146855    144954     144395   141608   128047
  151. obj1    10312     10310     10333     10307      10295    10572    10819
  152. obj2    84983     84981     82052     81213      81336    80806    85465
  153. paper1  19678     19676     18710     18519      18525    18607    16895
  154. paper2  32098     32096     30034     29566      29674    29825    25453
  155. pic     52223     52221     53578     52777      55051    51778    55461
  156. progc   13943     13941     13408     13363      13238    13475    12896
  157. progl   16916     16914     16408     16148      16175    16586    17354
  158. progp   11509     11507     11308     11214      11182    11647    11668
  159. trans   22580     22578     20046     19808      18879    20506    21023
  160.       1,096,166 1,096,138 1,036,934 1,022,523 1,021,043 1,005,367  890,976
  161. real    4m07s     6m03s                         1m49s   1h22m17s  27m05s
  162. user    3m47s     4m23s                         1m43s   1h20m46s  19m27s
  163. sys     0m04s     0m08s                         0m02s      0m12s   2m03s
  164. MSDOS:            1m49s     2m41s     1m55s
  165.  
  166. Notes:
  167.  
  168. - the compressed data for 'zoo ah' is always two bytes longer than for
  169.   lha. This is simply because both programs are derived from the same
  170.   source (ar002, written by Haruhiko Okumura, available by ftp in
  171.   wuarchive.wustl.edu:/mirrors/msdos/arc_lbr/ar002.zip).
  172.  
  173. - hpack 0.75a gives slightly different results on SunOS (undeterministic
  174.   behaviour still under investigation).
  175.  
  176. - the MSDOS versions are all optimized with assembler code and were run
  177.   on a RAM disk. So it is not surprising that they often go faster than
  178.   their Unix equivalent.
  179.  
  180. ------------------------------------------------------------------------------
  181.  
  182. Subject: [7] Which books should I read?
  183.  
  184.  
  185. [BWC 1989] Bell, T.C, Witten, I.H, and Cleary, J.G.  "Text Compression",
  186.     Prentice-Hall 1989. ISBN: 0-13-911991-4. Price: approx. US$40
  187.     The reference on text data compression.
  188.  
  189. [Nel 1991] Mark Nelson, "The Data Compression Book"
  190.     M&T Books, Redwood City, CA, 1991.  ISBN 1-55851-216-0.
  191.     Price $36.95 including two 5" PC-compatible disks bearing
  192.     all the source code printed in the book.
  193.     A practical introduction to data compression.
  194.     The book is targeted at a person who is comfortable reading C code but
  195.     doesn't know anything about data compression.  Its stated goal is to get
  196.     you up to the point where you are competent to program standard
  197.     compression algorithms.
  198.  
  199. [Will 1990] Williams, R.  "Adaptive Data Compression", Kluwer Books, 1990.
  200.     ISBN: 0-7923-9085-7. Price: US$75.
  201.     Reviews the field of text data compression and then addresses the
  202.     problem of compressing rapidly changing data streams.
  203.  
  204. [Stor 1988] Storer, J.A.  "Data Compression: Methods and Theory", Computer
  205.     Science Press, Rockville, MD. ISBN: 0-88175-161-8.
  206.     A survey of various compression techniques, mainly statistical
  207.     non-arithmetic compression and LZSS compression.  Includes complete Pascal
  208.     code for a series of LZ78 variants.
  209.  
  210. [ACG 1991] Advances in Speech Coding, edited by Atal, Cuperman, and Gersho,
  211.     Kluwer Academic Press, 1991.
  212.  
  213. [GG 1991] Vector Quantization and Signal Compression, by Gersho and Gray,
  214.     Kluwer Acad. Press, 1991
  215.  
  216. [CT 1991] Elements of Information Theory, by T.M.Cover and J.A.Thomas
  217.      John Wiley & Sons, 1991.
  218.  
  219. Review papers:
  220.  
  221. [BWC 1989] Bell, T.C, Witten, I.H, and Cleary, J.G.  "Modeling for Text
  222.     Compression", ACM Computing Surveys, Vol.21, No.4 (December 1989), p.557
  223.     A good general overview of compression techniques (as well as modeling for
  224.     text compression); the condensed version of "Text Compression".
  225.  
  226. [Lele 1987] Lelewer, D.A, and Hirschberg, D.S.  "Data Compression", ACM
  227.     Computing Surveys, Vol.19, No.3 (September 1987), p.261.
  228.     A survey of data compression techniques which concentrates on Huffman
  229.     compression and makes only passing mention of other techniques.
  230.  
  231.  
  232. ------------------------------------------------------------------------------
  233.  
  234. Subject: [8] What about patents on data compression algorithms?
  235.  
  236.  
  237. [Note: the appropriate group for discussing software patents is
  238. comp.patents (or misc.legal.computing), not comp.compression.]
  239.  
  240. All patents mentioned here are US patents, and thus probably
  241. not applicable outside the US. See item 70, "Introduction to data
  242. compression" for the meaning of LZ77, LZ78 or LZW.
  243.  
  244.  
  245. (a) Run length encoding
  246.  
  247. - Tsukiyama has two patents on run length encoding: 4,586,027 and 4,872,009
  248.   granted in 1986 and 1989 respectively. The first one covers run length
  249.   encoding in its most primitive form: a length byte followed by the
  250.   repeated byte. The second patent covers the 'invention' of limiting the
  251.   run length to 16 bytes and thus the encoding of the length on 4 bits.
  252.   Here is the start of claim 1 of patent 4,872,009, just for pleasure:
  253.  
  254.     1. A method of transforming an input data string comprising a plurality
  255.     of data bytes, said plurality including portions of a plurality of
  256.     consecutive data bytes identical to one another, wherein said data
  257.     bytes may be of a plurality of types, each type representing different
  258.     information, said method comprising the steps of: [...]
  259.  
  260.  
  261. (b) LZ77
  262.  
  263. - The Gibson & Graybill patent 5,049,881 covers the LZRW1 algorithm
  264.   previously discovered by Ross Williams. (See item 5 for the ftp site
  265.   with all LZRW derivatives). Claims 4 and 12 are very general and
  266.   could be interpreted as applying to any LZ algorithm using hashing
  267.   (including all variants of LZ78):
  268.  
  269.      4. A compression method for compressing a stream of input data into
  270.      a compressed stream of output data based on a minimum number of
  271.      characters in each input data string to be compressed, said
  272.      compression method comprising the creation of a hash table, hashing
  273.      each occurrence of a string of input data and subsequently searching
  274.      for identical strings of input data and if such an identical string
  275.      of input data is located whose string size is at least equal to the
  276.      minimum compression size selected, compressing the second and all
  277.      subsequent occurrences of such identical string of data, if a string
  278.      of data is located which does not match to a previously compressed
  279.      string of data, storing such data as uncompressed data, and for each
  280.      input strings after each hash is used to find a possible previous
  281.      match location of the string, the location of the string is stored
  282.      in the hash table, thereby using the previously processed data to
  283.      act as a compression dictionary.
  284.  
  285.   Claim 12 is identical, with 'method' replaced with 'apparatus'.
  286.   Since the 'minimal compression size' can be as small as 2, the claim
  287.   could cover any dictionary technique of the LZ family. However the
  288.   text of the patent and the other claims make clear that the patent
  289.   should cover the LZRW1 algorithm only.
  290.  
  291.   The following papers, published before the patent was filed, describe
  292.   applications of hashing to LZ77 compression:
  293.  
  294.     Brent, R.P.  "A Linear Algorithm for Data Compression", Australian
  295.     Computer Journal, Vol.19, No.2 (May 1987), p.64.
  296.  
  297.     Bell, T. "Longest match string searching for Ziv-Lempel compression"
  298.     Res. Rept. 6/89, Dept. of Computer Science, Univ. of Canterbury,
  299.     New Zealand (Feb 89).
  300.  
  301.  
  302. - Phil Katz, author of pkzip, also has a patent on LZ77 (5,051,745)
  303.   but the claims only apply to sorted hash tables, and when the hash
  304.   table is substantially smaller than the window size.
  305.  
  306. - Robert Jung, author of 'arj', has recently been granted patent 5,140,321
  307.   for one variation of LZ77 with hashing.  This patent covers the LZRW3-A
  308.   algorithm, also previously discovered by Ross Williams. LZRW3-A was posted
  309.   on comp.compression on July 15, 1991. The patent was filed two months later
  310.   on Sept 4, 1991. (The US patent system allows this because of the
  311.   'invention date' rule.)
  312.  
  313. - Fiala and Greene obtained in 1990 a patent (4,906,991) on all
  314.   implementations of LZ77 using a tree data structure. Claim 1 of the
  315.   patent is much broader than the algorithms published by Fiala and
  316.   Greene in Comm.ACM, April 89. The patent covers the algorithm
  317.   published by Rodeh and Pratt in 1981 (J. of the ACM, vol 28, no 1,
  318.   pp 16-24).  It also covers the algorithm previously patented by
  319.   Eastman-Lempel-Ziv (4,464,650), and the algorithms used in lharc,
  320.   lha and zoo.
  321.  
  322. - IBM patented (5,001,478) the idea of combining a history buffer (the
  323.   LZ77 technique) and a lexicon (as in LZ78).
  324.  
  325.  
  326. (c) LZ78
  327.  
  328. - The LZW algorithm used in 'compress'is patented by IBM (4,814,746)
  329.   and Unisys (4,558,302). It is also used in the V.42bis compression
  330.   standard (see question 11 on V.42bis below) and in Postscript Level 2.
  331.   (Unisys sells the license to modem manufacturers for a onetime
  332.   $25,000 fee.) The IBM patent application was filed three weeks
  333.   before that of Unisys, but the US patent office failed to recognize
  334.   that they covered the same algorithm. (The IBM patent is more
  335.   general, but its claim 7 is exactly LZW.)
  336.  
  337. - AP coding is patented by Storer (4,876,541). (Get the yabba package
  338.   for source code, see question 2 above, file type .Y)
  339.  
  340.  
  341. (d) other data compression algorithms
  342.  
  343. - IBM holds a patent on the Q-coder implementation of arithmetic
  344.   coding.  The arithmetic coding option of the JPEG standard requires
  345.   use of the patented algorithm.  No JPEG-compatible method is
  346.   possible without infringing the patent, because what IBM actually
  347.   claims rights to is the underlying probability model (the heart of
  348.   an arithmetic coder). (See the JPEG FAQ for details.)
  349.  
  350. - Bacon has patented (4,612,532) some from of Markov modeling.
  351.  
  352.  
  353. As can be seen from the above list, *all* the most popular compression
  354. programs (compress, pkzip, zoo, lha, arj) are now covered by patents.
  355. (This says nothing about the validity of these patents.)
  356.  
  357. Here are some references on data compression patents. A number of them are
  358. taken from the list maintained by Michael Ernst <mernst@theory.lcs.mit.edu>
  359. in mintaka.lcs.mit.edu:/mitlpf/ai/patent-list (or patent-list.Z).
  360.  
  361. 4,464,650
  362. Apparatus and method for compressing data signals and restoring the
  363. compressed data signals
  364. inventors Lempel, Ziv, Cohn, Eastman
  365. assignees Sperry Corporation and At&T Bell Laboratories
  366. filed 8/10/81, granted 8/7/84
  367.  
  368. 4,558,302
  369. High speed data compression and decompression apparatus and method
  370. inventor Welch
  371. assignee Sperry Corporation (now Unisys)
  372. filed 6/20/83, granted 12/10/85
  373. The text for this patent can be ftped from rusmv1.rus.uni-stuttgart.de
  374. (129.69.1.12) in /info/comp.patents/US4558302.Z.
  375.  
  376. 4,586,027
  377. Method and system for data compression and restoration
  378. assignee Hitachi, inventor Tsukimaya et al.
  379. filed 08/07/84, granted 04/29/86
  380.  
  381. 4,612,532
  382. inventor Bacon
  383. granted 9/1986
  384.  
  385. 4,814,746
  386. Data compression method
  387. inventors Victor S. Miller, Mark N. Wegman
  388. assignee IBM
  389. filed 8/11/86, granted 3/21/89
  390. A previous application was filed on 6/1/83, three weeks before the
  391. application by Welch (4,558,302)
  392.  
  393. 4,872,009
  394. Method and apparatus for data compression and restoration
  395. assignee Hitachi, inventor Tsukimaya et al.
  396. filed 12/07/87, granted 10/03/89
  397.  
  398. 4,876,541
  399. Stem [sic] for dynamically compressing and decompressing electronic data
  400. inventor James A. Storer
  401. assignee Data Compression Corporation
  402. filed 10/15/87, granted 10/24/89
  403.  
  404. 4,955,066
  405. Compressing and Decompressing Text Files
  406. inventor Notenboom, L.A.
  407. assignee Microsoft
  408. filed  10/13/89, granted 09/04/90
  409.  
  410. 5,001,478
  411. Method of Encoding Compressed Data
  412. filed 12/28/89, granted 03/19/91
  413. inventor Michael E. Nagy
  414. assignee IBM
  415.  
  416. 5,049,881
  417. Apparatus and method for very high data rate-compression incorporating
  418. lossless data compression and expansion utilizing a hashing technique
  419. inventors Dean K. Gibson, Mark D. Graybill
  420. assignee Intersecting Concepts, Inc.
  421. filed 6/18/90, granted 9/17/91
  422.  
  423. 5,051,745
  424. String searcher, and compressor using same
  425. inventor  Phillip W. Katz (author of pkzip)
  426. filed  8/21/90, granted 9/24/91
  427.  
  428. 4,906,991
  429. Textual substitution data compression with finite length search window
  430. inventors Fiala,E.R., and Greene,D.H.
  431. filed 4/29/1988, granted 3/6/1990
  432. assignee Xerox Corporation
  433.  
  434. 5,109,433
  435. Compressing and decompressing text files
  436. assignee Microsoft
  437.  
  438. 5,140,321
  439. Data compression/decompression method and apparatus
  440. filed 9/4/91, granted 8/18/92
  441. inventor Robert Jung
  442. assignee Prime Computer
  443.  
  444. ------------------------------------------------------------------------------
  445.  
  446. Subject: [9]  The WEB 16:1 compressor.
  447.  
  448.  
  449. [WARNING: this topic has generated the greatest volume of news in the
  450. history of comp.compression. Read this before posting on this subject.]
  451.  
  452.  
  453. (a) What the press says
  454.  
  455. April 20, 1992  Byte Week Vol 4. No. 25:
  456.  
  457.    "In an announcement that has generated high interest - and more than a
  458.    bit of skepticism - WEB Technologies (Smyrna, GA) says it has
  459.    developed a utility that will compress files of greater than 64KB in
  460.    size to about 1/16th their original length.  Furthermore, WEB says its
  461.    DataFiles/16 program can shrink files it has already compressed."
  462.    [...]
  463.    "A week after our preliminary test, WEB showed us the program successfully
  464.    compressing a file without losing any data.  But we have not been able
  465.    to test this latest beta release ourselves."
  466.    [...]
  467.    "WEB, in fact, says that virtually any amount of data can be squeezed
  468.    to under 1024 bytes by using DataFiles/16 to compress its own output
  469.    multiple times."
  470.  
  471. June 1992 Byte, Vol 17 No 6:
  472.  
  473.    [...] According to Earl Bradley, WEB Technologies' vice president of
  474.    sales and marketing, the compression algorithm used by DataFiles/16
  475.    is not subject to the laws of information theory. [...]
  476.  
  477.  
  478. (b) First details, by John Wallace <buckeye@spf.trw.com>:
  479.  
  480. I called WEB at (404)514-8000 and they sent me some product
  481. literature as well as chatting for a few minutes with me on the phone.
  482. Their product is called DataFiles/16, and their claims for it are
  483. roughly those heard on the net.
  484.  
  485. According to their flier:
  486.  
  487. "DataFiles/16 will compress all types of binary files to approximately
  488. one-sixteenth of their original size ... regardless of the type of
  489. file (word processing document, spreadsheet file, image file,
  490. executable file, etc.), NO DATA WILL BE LOST by DataFiles/16."
  491. (Their capitalizations; 16:1 compression only promised for files >64K
  492. bytes in length.)
  493.  
  494. "Performed on a 386/25 machine, the program can complete a
  495. compression/decompression cycle on one megabyte of data in less than
  496. thirty seconds"
  497.  
  498. "The compressed output file created by DataFiles/16 can be used as the
  499. input file to subsequent executions of the program.  This feature of
  500. the utility is known as recursive or iterative compression, and will
  501. enable you to compress your data files to a tiny fraction of the
  502. original size.  In fact, virtually any amount of computer data can
  503. be compressed to under 1024 bytes using DataFiles/16 to compress its
  504. own output files muliple times.  Then, by repeating in reverse the
  505. steps taken to perform the recusive compression, all original data
  506. can be decompressed to its original form without the loss of a single
  507. bit."
  508.  
  509. Their flier also claims:
  510.  
  511. "Constant levels of compression across ALL TYPES of FILES"
  512. "Convenient, single floppy DATA TRANSPORTATION"
  513.  
  514. From my telephone conversation, I was was assured that this is an
  515. actual compression program.  Decompression is done by using only the
  516. data in the compressed file; there are no hidden or extra files.
  517.  
  518.  
  519. (c) More information, by Rafael Ramirez <rafael.ramirez@channel1.com>:
  520.  
  521.    Today (Tuesday, 28th) I got a call from Earl Bradley of Web
  522. who now says that they have put off releasing a software version of
  523. the algorithm because they are close to signing a major contract with
  524. a big company to put the algorithm in silicon.  He said he could not
  525. name the company due to non-disclosure agreements, but that they had
  526. run extensive independent tests of their own and verified that the
  527. algorithm works. [...]
  528.  
  529. He said the algorithm is so simple that he doesn't want anybody
  530. getting their hands on it and copying it even though he said they
  531. have filed a patent on it. [...] Mr. Bradley said the silicon version
  532. would hold up much better to patent enforcement and be harder to copy.
  533.  
  534.    He claimed that the algorithm takes up about 4K of code, uses only
  535. integer math, and the current software implementation only uses a 65K
  536. buffer.  He said the silicon version would likely use a parallel
  537. version and work in real-time. [...]
  538.  
  539.  
  540. (d) The impossiblity proofs.
  541.  
  542. It is impossible for a given program to compress without loss *all*
  543. files greater than a certain size by at least one bit. This can be
  544. proven by a simple counting argument. (Many other proofs have been
  545. posted on comp.compression, *please* do not post yet another one.)
  546.  
  547. Assume that the program can compress without loss all files of size >= N
  548. bits.  Compress with this program all the 2^N files which have
  549. exactly N bits.  All compressed files have at most N-1 bits, so there
  550. are at most (2^N)-1 different compressed files [2^(N-1) files of size
  551. N-1, 2^(N-2) of size N-2, and so on, down to 1 file of size 0]. So at
  552. least two different input files must compress to the same output file.
  553. Hence the compression program cannot be lossless. (Stronger results
  554. about the number of incompressible files can be obtained, but the
  555. proofs are a little more complex.)
  556.  
  557. This argument applies of course to WEB's case (take N = 64K*8 bits).
  558. Note that no assumption is made about the compression algorithm.
  559. The proof applies to *any* algorithm, including those using an
  560. external dictionary, or repeated application of another algorithm,
  561. or combination of different algorithms, or representation of the
  562. data as formulas, etc... All schemes are subject to the counting argument.
  563. There is no need to use information theory to provide a proof, just
  564. basic mathematics.
  565.  
  566. This assumes of course that the information available to the decompressor
  567. is only the bit sequence of the compressed data. If external information
  568. such as a file name or a number of iterations is necessary to decompress
  569. the data, the bits providing the extra information must be included in
  570. the bit count of the compressed data. (Otherwise, it would be sufficient
  571. to consider any input data as a number, use this as the iteration
  572. count or file name, and pretend that the compressed size is zero.)
  573.  
  574. [See also question 73 "What is the theoretical compression limit?" in
  575. part 2 of this FAQ.]
  576.  
  577.  
  578. (e) No software version
  579.  
  580. Appeared on BIX, reposted by Bruce Hoult <Bruce.Hoult@actrix.gen.nz>:
  581.  
  582. tojerry/chaos #673, from abailey, 562 chars, Tue Jun 16 20:40:34 1992
  583. Comment(s).
  584. ----------
  585. TITLE: WEB Technology
  586. I promised everyone a report when I finally got the poop on WEB's
  587. 16:1 data compression. After talking back and forth for a year
  588. and being put off for the past month by un-returned phone calls,
  589. I finally got hold of Marc Spindler who is their sales manager.
  590.  
  591. _No_ software product is forth coming, period!
  592.  
  593. He began talking about hardware they are designing for delivery
  594. at the end of the year. [...]
  595.  
  596.  
  597. (f) Product cancelled
  598.  
  599. Posted by John Toebes <toebes@bnr.ca> on Aug 10th, 1992:
  600.  
  601. [Long story omitted, confirming the reports made above about the
  602. original WEB claims.]
  603.  
  604. 10JUL92 - Called to Check Status.  Was told that testing had uncovered a
  605.           new problem where 'four numbers in a matrix were the same
  606.           value' and that the programmers were off attempting to code a
  607.           preprocessor to eliminate this rare case.  I indicated that he
  608.           had told me this story before.  He told me that the
  609.           programmers were still working on the problem.
  610.  
  611. 31JUL92 - Final Call to Check Status.  Called Earl in the morning and
  612.           was told that he still had not heard from the programmers. [...]
  613.           Stated that if they could not resolve the problem then there would
  614.           probably not be a product.
  615.  
  616. 03AUG92 - Final Call.  Earl claims that the programmers are unable to
  617.           resolve the problem.  I asked if this meant that there would
  618.           not be a product as a result and he said yes.
  619.  
  620.  
  621. (g) Conclusion
  622.  
  623. The last report given above should put an end to the WEB story.
  624.  
  625. [Note from the FAQ maintainer: I will keep this long story in the FAQ
  626. for a while, and will remove it when the dust has finally settled
  627. down.]
  628.  
  629. ------------------------------------------------------------------------------
  630.  
  631. Subject: [11] What is the V.42bis standard?
  632.  
  633.  
  634. A description of the V.42bis standard is given in "The V.42bis
  635. standard for data-compressing modems," by Clark Thomborson
  636. <cthombor@theory.lcs.mit.edu>, IEEE Micro, Oct 1992, pp. 41-53.
  637.  
  638. Short introduction, by Alejo Hausner <hausner@qucis.queensu.ca>:
  639.  
  640. The V.42bis Compression Standard was proposed by the International
  641. Consultative Committee on Telephony and Telegraphy (CCITT) as an
  642. addition to the v.42 error-correction protocol for modems. Its purpose
  643. is to increase data throughput, and uses a variant of the
  644. Lempel-Ziv-Welch (LZW) compression method.  It is meant to be
  645. implemented in the modem hardware, but can also be built into the
  646. software that interfaces to an ordinary non-compressing modem.
  647.